富集分析
生信学习之通路富集一(GO分析)_go富集分析-CSDN博客
生信学习之通路富集一(GO分析):
富集分析的理论知识
富集分析(Enrichment Analysis)是一种广泛应用于生物信息学研究的统计方法,主要用于检验一个基因集合中某些功能或特征的富集程度。富集分析的主要目的是从大量基因数据中找出有生物学意义的模式和功能。根据分析的目标和方法,富集分析可以分为以下几种类型:
基因本体论富集分析(Gene Ontology Enrichment Analysis):
这是最常用的富集分析类型,用于检验基因集合中基因本体论(GO)条目的富集情况。这可以帮助研究者了解基因集合中的基因在生物学过程、分子功能和细胞组成方面的共同特征。GSEA分析似乎与GO分析类似但又有所不同。GO分析更加依赖差异基因,实则是对一部分基因的分析 (忽略差异不显著的基因),而GSEA是从全体基因的表达矩阵中找出具有协同差异 (concordant differences)的基因集,故能兼顾差异较小的基因。因此二者的应用场景略有区别。另外GO富集是定性的分析,GSEA考虑到了表达或其它度量水平的值的影响。另外,对于时间序列数据或样品有定量属性时,GSEA的优势会更明显,不需要每个分组分别进行富集,直接对整体进行处理。可以类比于之前的WGCNA分析。
原文链接:https://blog.csdn.net/qazplm12_3/article/details/122076674
通路富集分析(Pathway Enrichment Analysis):
这种类型的富集分析主要关注基因在代谢途径和信号传导通路中的作用。通过检测基因集合中通路的富集情况,研究者可以了解这些基因在生物体内的功能和调控机制。通路数据库如KEGG(Kyoto Encyclopedia of Genes and Genomes)和Reactome是进行通路富集分析的常用资源。
基因集富集分析(Gene Set Enrichment Analysis,GSEA):
GSEA是一种旨在检测一个基因集合(如差异表达基因)与某些生物学特征(如基因本体论、通路、疾病、表型等)之间的关联的方法。GSEA可以帮助研究者了解基因集合与生物学功能和过程之间的关联,从而揭示潜在的生物学意义。
蛋白质-蛋白质相互作用富集分析(Protein-Protein Interaction Enrichment Analysis):
这种类型的富集分析关注蛋白质之间的相互作用,帮助研究者了解基因集合中蛋白质在细胞信号和代谢过程中的功能。
基因表达调控富集分析:这种类型的富集分析关注转录因子、miRNA等调控因子对基因表达的调控作用。通过这种富集分析,研究者可以了解基因表达的调控机制和相互关系。
GO分析的理论知识
基因本体论(Gene Ontology, GO)是一个用于描述基因和基因产品属性的标准术语体系。它提供了一个有组织的方式来表示基因在生物体内的各种角色。基因本体论通常从三个层面对基因进行描述:细胞成分(Cellular Component,CC)、生物学过程(Biological Process,BP)和分子功能(Molecular Function,MF)。
细胞成分(Cellular Component,CC):这个层面描述了基因产物(如蛋白质)在细胞内的定位。例如,它们可能位于细胞核、细胞质、线粒体膜或其他细胞器上。这有助于了解基因产物在细胞内的作用和功能。
生物学过程(Biological Process,BP):这个层面描述了基因参与的生物学过程。这些过程可能包括细胞生长、信号传导、基因表达调控、代谢途径等。通过了解基因参与的生物学过程,我们可以更好地理解生物体的生理功能和疾病发生机制。
分子功能(Molecular Function,MF):这个层面描述了基因产物在分子层面的功能,通常涉及到与其他分子的相互作用或催化生化反应。例如,某个基因产物可能是一个酶,它能够催化某个特定的生化反应;或者它可能是一个结构蛋白,参与细胞骨架的组装和维持。
基因本体论为研究者提供了一个系统的方法来表示和共享关于基因和基因产品在生物体内的功能和过程的知识。这有助于促进基因功能研究的发展,提高研究效率,为疾病治疗和药物研发提供重要信息。
————————————————
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/coffeeii/article/details/130355514
1、ssGSEA
单样本基因集富集分析(single sample gene set enrichment analysis, ssGSEA),原理上与GSEA类似,不同的是GSEA 主要用于检测不同实验组(如实验组和对照组)之间基因集富集差异,而ssGSEA将样本内基因表达谱进行归一化处理,然后计算每个基因集对应的ssGSEA得分。通过这种方式,ssGSEA将单个样本的基因表达谱转换为基因集富集得分矩阵。因此,如果使用的是免疫细胞marker组成的基因集,ssGESA也可以计算免疫细胞浸润评分。
2、GSVA
基因集变异分析(Gene Set Variation Analysis,GSVA)和ssGSEA非常相似,同样是对单个样本进行计算,最后输出的也是一个行为不同基因集、列为样本的矩阵。主要区别在于GSVA使用的是非参数核密度估计方法,而ssGSEA是基于样本排序的积分方法。
3.
接触过ssGSEA的人应该可以很直观地说出GSEA和ssGSEA的区别。GSEA是对不同表型、不同分组进行分析,不管每个分组有多少个样本,对于一个基因集S,最后只会得到一个组间或者表型间比较后的NES(S),换句话说,GSEA必须有表型或者分组信息;而ssGSEA是单样本的GSEA,对于一个基因集S,每一个样本都可以计算得到一个NES(S)。也就是说其实我们可以从表达矩阵得到一个NES矩阵,行是多个不同的基因集S,列仍然是样本。
作者:annfall
链接:https://www.jianshu.com/p/47f9f0107ffe
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。